Evaluation de la précision pour un système hypertexte
نویسندگان
چکیده
RÉSUMÉ. Certains moteurs de recherche, par exemple Google, utilisent les liens hypertextes dans le processus de sélection des documents en réponse à une requête. Dans ce papier, nous présentons une nouvelle fonction de correspondance qui effectue un classement des réponses à partir d’une mesure d’appariement entre les mots clés d’une requête et le texte ancre associé aux liens hypertextes des pages. Nous avons évalué cette fonction de correspondance par des expérimentations sur la collection TREC-9 et nous concluons que pour certains types de requêtes, notre système fournit de meilleures réponses en terme de précision.
منابع مشابه
Construction et utilisation de contextes autour des noeuds d'un hypertexte pour la recherche d'information
RÉSUMÉ. Nous faisons l’hypothèse que la mise sous forme hypertexte d’un document atomise l’information dans le sens où les nœuds de l’hypertexte qui sont créés ne sont pas auto-suffisants pour pouvoir être appréhendés. Sous cette hypothèse, le contenu seul du nœud n’est pas suffisant pour l’indexer dans un but de l’insérer dans un système de recherche d’information. Nous avons implémenté et tes...
متن کاملÉtude Comparative des Algorithmes de Segmentation Thématique Pour la Langue Arabe
Résumé. Le besoin d'avoir un système de segmentation thématique des textes arabesa pour but d’améliorer les fonctionnalités de la Recherche d'Information Arabe (RIA). La segmentation thématique des textes a été utilisée pour améliorer la précision des processus subséquents telle que les systèmes de résumé automatique, les systèmes de Question/Réponses et les systèmes de recherche d’information....
متن کاملDes systèmes multiagents anytime pour la conception de systèmes d'aide à la décision
RÉSUMÉ. Dans un système d’aide à la décision (S.A.D.), un système informatique doit permettre au décideur de prendre la meilleure décision possible, souvent avant une échéance donnée. Nous considérons dans ce papier les S.A.D. qui reposent sur une modélisation multiagent. L’objectif de notre travail est d’étendre la notion de système multiagent à un environnement contraint par le temps, c’est-à...
متن کاملIntegrating lexical, syntactic and system-based features to improve Word Confidence Estimation in SMT
L’estimation des mesures de confiance (MC) au niveau des mots consiste à prédire leur exactitude dans la phrase cible générée par un système de traduction automatique. Ceci permet d’estimer la fiabilité d'une sortie de traduction et de filtrer les segments trop mal traduits pour une post-édition. Nous étudions l’impact sur le calcul des MC de différents paramètres : lexicaux, syntaxiques et iss...
متن کاملMesures Hiérarchiques pondérées pour l'évaluation d'un système semi-automatique d'annotation de génomes utilisant des arbres de décision
Résumé. L’annotation d’une protéine consiste, entre autres, à lui attribuer une classe dans une hiérarchie fonctionnelle. Celle-ci permet d’organiser les connaissances biologiques et d’utiliser un vocabulaire contrôlé. Pour estimer la pertinence des annotations, des mesures telles que la précision, le rappel, la spécificité et le Fscore sont utilisées. Cependant ces mesures ne sont pas toujours...
متن کامل